import scrapy


class XiaoyuoxiSpider(scrapy.Spider):
    name = "xiaoyuoxi"  # 爬虫的名字
    allowed_domains = ["www.4399.com"]
    start_urls = ["https://www.4399.com/flash/"]

    # 负责start_url的解析
    def parse(self, resp, **kwargs):
        # 由于 框架的原因，resp就是已经从网页获取的内容
        # 查看页面获取的信息
        # 我们只要从网页获取的内容中找到需要的值，然后通过Xpath提取出啦就行
        lis = resp.xpath('//*[@id="skinbody"]/div[8]/ul[@class="n-game cf"]/li')
        # 进行遍历获取每一个元素里面的值
        for li in lis:
            # extract_first()  去第一个返货的数据
            li_html = li.xpath("./a/@href").extract_first()
            li_name = li.xpath("./a/b/text()").extract_first()
            # 取第二个em的值
            li_time = li.xpath("./em/text()").extract_first()
            # print(li_html, li_name, li_time)
            yield {
                "li_html": li_html,
                "li_name": li_name,
                "li_time": li_time
            }
